AI资讯新闻榜单内容搜索-Opus 4.7

刚刚，OpenAI 放出满血版 GPT-5.5-Cyber！剑指 Claude Mythos 5

就在刚刚，OpenAI 直接放出了满血版 GPT-5.5-Cyber。CyberGym 安全评测排行榜，GPT-5.5-Cyber 得分 85.6%，单模型最高分。Claude Mythos 5 第二，83.8%。Claude Opus 4.7 排末尾，73.1%。

来自主题: AI资讯

9325 点击 2026-06-23 09:09

GLM-5.2 正式发布：开源之王来了，摸到了Opus-4.8

GLM-5.2 正式发布，震撼全网，主打长程任务能力，配合 1M token 上下文窗口，且完全开源（MIT 协议）。在相近的 token 消耗下，GLM-5.2 的能力大致介于 Opus 4.7 和 Opus 4.8 之间，参数仅为753B。

来自主题: AI资讯

10089 点击 2026-06-17 10:50

Anthropic官宣融资4407亿，估值超越Openai，同时最强通用模型 Claude Opus 4.8 登场

Anthropic最强通用模型Claude Opus 4.8正式发布，新模型基准测试全面超越Gemini 3.1 Pro、Opus 4.7，仅一项逊色于GPT-5.5，但其标准模式价格不变，快速模式价格仅为Opus 4.7的1/3。与此同时，Anthropic还官宣一笔650亿美元（约合人民币4406.94亿元）H轮巨额融资，投后估值冲上9650亿美元（约合人民币6.54万亿元）

来自主题: AI资讯

10251 点击 2026-05-29 10:40

刚刚，Claude Opus 4.8来了！两个史上首次改写历史

Opus 4.7发布刚43天，Opus 4.8就来了！编程实力暴增，全面霸榜。Claude Code一口气放出上百个agent并行干活，一个人11天就能重写75万行代码、99.8%测试通过。更狠的Claude Mythos，几周后就来。

来自主题: AI资讯

9201 点击 2026-05-29 09:00

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力，看Qwen3.7 Max 是否实至名归？！

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro，阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名，仅次于 Claude Opus 4.7。除了真实场景的用户选择，在传统的大模型固定评测榜单上，像是终端能力 Terminal Bench、编程能力 SWE Bench 等，Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评

9798 点击 2026-05-28 12:06